Ampliación de WordNet mediante extracción léxica a partir de un diccionario de sinónimos
نویسندگان
چکیده
1. Introducción El objetivo del experimento presentado en este trabajo es la expansión del WordNet gallego mediante extracción léxica a partir de un diccionario de sinónimos de esta lengua. El experimento se realiza dentro del proyecto coordinado SKATeR en el que nuestro grupo tiene como objetivo prioritario la construcción de Galnet, la versión gallega del WordNet 3.0. El marco de desarrollo en el que se integra Galnet es el Multilingual Central Repository (MCR) [4], una plataforma que abarca los léxicos WordNet de cinco lenguas (inglés, español, catalán, vasco y gallego) enlazados por el ı́ndice interlingǘıstico (ILI) correspondiente al WordNet 3.0 y con los synsets categorizados en la jerarqúıa de dominios IRST y en las ontoloǵıas SUMO y Top Concept Ontology. Galnet se distribuye con licencia Creative Commons como parte del MCR. La versión de Galnet de esta distribución alcanza la cobertura léxica que se muestra en la Tabla 1 en comparación con la del WordNet 3.0 del inglés.
منابع مشابه
O dicionario de sinónimos como recurso para a expansión de WordNet
Esta investigación reaĺızase no marco do proxecto Adquisición de escenarios de conocimiento a través de la lectura de textos: Desarrollo y aplicación de recursos para el procesamiento lingǘıstico del gallego (SKATeR-UVIGO) financiado polo Ministerio de Economı́a y Competitividad, TIN2012-38584-C06-04. Queremos agradecer aqúı sinceramente as valiosas contribucións para a mellora do artigo das tre...
متن کاملExtracción automática de un diccionario de colocaciones en español
Resumen. Las colocaciones son pares de palabras de contenido que forman las relaciones sintácticas de dependencia razonables, directamente o a través de palabras funcionales. Tales pares tienden usarse en los textos más frecuentemente de lo esperado por casualidad. El texto en lenguaje natural consiste casi totalmente de tales colocaciones. La información de las palabras que forman colocaciones...
متن کاملInternet como fuente de información léxica: extracción de etiquetas de dominio y detección de nuevos sentidos
Resumen Describimos un algoritmo que combina información léxica (extráıda de WordNet 1.6) con información en Internet (directorios de Altavista) para caracterizar automáticamente los sentidos de una palabra con etiquetas de dominio y, al mismo tiempo, detectar y describir nuevos sentidos relevantes en Internet. Esta información puede utilizarse, entre otras cosas, para enriquecer bases de datos...
متن کاملEnriquecimiento automático de un léxico afectivo basado en relaciones semánticas obtenidas de un diccionario explicativo en español
Resumen. Las relaciones semánticas de sinonimia e hiperonimia son estudiadas y utilizadas en varios problemas de PLN. En este trabajo se estudian y procesan para incrementar las palabras en un léxico afectivo, con base en la determinación de patrones que utiliza el diccionario de la Real Academia de la Lengua Española en las definiciones de sustantivos y verbos. La definición de los diccionario...
متن کاملUtilizando WordNet para Complementar la Información de Entrenamiento en la Identificación del Significado de las Palabras
La desambiguación del significado de las palabras se ha desarrollado como una subárea del Procesamiento del Lenguaje Natural (PLN), donde el objetivo es determinar el sentido correcto de aquellas palabras que tienen más de un significado, no es una tarea final en sí misma, sino una tarea intermedia necesaria en variadas aplicaciones del procesamiento del lenguaje natural. La resolución de la am...
متن کامل